#Open AI
Open AI 的8億周活使用者,到底意味著什麼?——a16z前合夥人如何為AI“降噪”(下)
在上一期的【泉果探照燈】中,我們介紹了“25年來致力於去除科技行業噪音”的前a16z合夥人Benedict Evans,他從過去20年的科技迭代的歷史視角,試圖為大家還原一個對AI既不誇大,也不恐懼的“喧囂之下的真相”。您可以從這裡回溯上一篇文章,以獲得關於Benedict更為完整的介紹:時光倒流20年,資本的科技敘事是如何演化的?——a16z前合夥人如何“降噪”(上)今天,我們繼續連載Benedict的AI核心觀點,主要回答3個問題:■  AI將在那些環節產生價值?■  它會通過什麼管道送到我們手中?■  它會摧毀什麼?又會催生什麼?以下是Benedict第一人稱視角精編:AI模型的護城河,到底在那裡?我們可以做個“盲測”:發同樣的指令給ChatGPT, Grock, Claude, Gemini, Mistral和DeepSeek。我敢打賭,只看答案,大多數人都分不清那個是那個。讓我們看看自從ChatGPT上線以來,發生了什麼?資本投資大量湧入、模型價格迅速下探、新東西層出不窮,熱詞縮寫滿天飛,但我們至今並沒有看到清晰的“護城河”,也沒有看到明顯的“贏家通吃”。關於科技大廠的CapEx和ROI的擔憂,大家聊得很多了,這裡不再贅述。他們的心態,用下面這一句話概括就足夠了:投資不足的風險,遠遠大於投資過度的風險。——Google CEO Sundar pichai,2024 Q2因為任何一個錯過“可能成為平台轉移”的窗口,都可能付出巨大的代價。比如微軟在從PC到智慧型手機的轉換中,教訓非常慘痛,這也讓它這次的押注更加堅決。結果就是,我們看到越來越多的大模型不斷湧現(如下圖),每周都有很多新增的模型,到年底更是進入了集中發佈期。圖1. 更多的大模型來源:《AI eats the world》模型有優劣,但頭部模型的差距其實並不大。下面這張圖顯示了兩個通用的基準測試,柱狀條表示:前十名模型的得分佔當周“第一名模型”的百分比。簡單說,所有模型彼此之間其實只差5%~10%。另外,第一名一直在變。每周都可能會出現一個新的“績優生”,有時領先會超過5%,但很快大家的性能又都收斂到了類似的區間。圖2. 頭部模型功能差距不大、第一名每周都有變化來源:《AI eats the world》但是,有一個指標可以拉開差距,那就是模型的使用量。如下圖,雖然模型能力相差不多,模型越來越接近“可替代的商品”,但是市場份額卻差距巨大。什麼決定了使用者會使用?更多的取決於品牌(ChatGPT)、管道(Microsoft Copilot)或生態繫結(Google)。同時,ChatGPT似乎正在成為一個動詞,就像Google成為搜尋的動詞一樣,這意味著它在成為一種默認選項。圖3. 誰決定了使用量:技術?品牌?還是管道?來源:《AI eats the world》如果退後一步,這些縮寫詞、性能圖表、參數指標和跑分基準……看起來很像20-30年前的個人電腦產業。那時你必須懂得那些術語縮寫才能買電腦,包括知道多少MHz,多少MB,用的是那款晶片。曾經組裝過電腦的人應該都熟悉,這是90年代的電腦雜誌封面:《191款最快的486電腦買家指南》《提速:CPU、顯示卡、主機板》《最快的56k數據機橫評》圖4. 速度、參數、各種縮寫:當年我們就是這樣對比電腦的來源:《AI eats the world》當一個技術剛出現時,所有人都會把注意力放在“參數比拚”上。但是技術成熟後,這些參數會變得無關緊要,這時,價值也會移動到系統、品牌、生態、應用等的其他層級。AI也可能會重複這個過程,當模型越來越標品化,價值則會延著價值鏈向上移動。所以,如果你是一個LLMs實驗室,你該如何競爭呢?你有兩個路徑:■  往下走,變成資本戰:像晶片、飛機製造、AWS那樣拼投入、拼規模化資本成本。■  往上走,變成軟體行業邏輯:拼產品、拼網路效應、拼“進入市場能力(Go-to-Market)”。而你最不能做的就是:拿出一個同質化的模型,然後簡單地給它貼個價簽。Open AI 的8億周活使用者,到底意味著什麼?從一個常被引用的數字說起:Open AI的8億周活使用者。乍一看,這個數字足以讓人覺得,“AI已經無處不在,塵埃落定了”。但需要追問的是,每周活躍一次,到底意味著什麼?綜合多份美國的調查,實際AI使用更接近於這樣一個分佈:每天用:約10%;每周用:15–20%;每月或每兩個月用一下:20–30%;看過,試過,然後就沒然後了:20-30%。在社交媒體時代,如果你真的喜歡一個app,那麼你應該是日活使用者。如果只是每周用一次,很難說它改變了你的生活——Sam Altman是做社交媒體起家的,他當然知道“周活使用者”這個指標很唬人。其實企業端,我們也觀察到了類似的節奏。現在大概有1/3的大企業,至少已經上線了一個生成式AI的應用,但還有1/4的企業甚至還沒有計畫做任何部署(如下圖)。圖5. AI落地比想像的慢?——許多大公司要到2026才真正開始動手來源:《AI eats the world》你會看到Accenture——全球最大的管理諮詢和技術服務公司——每個季度都有超過15億美元的AI新訂單,有很多試點項目在排隊上線。圖6. 當企業不知道怎麼用AI,就會去問諮詢公司Accenture AI合同金額持續上漲來源:《AI eats the world》但是,需要留意的是,從試點到真正投入使用,永遠需要時間。雖然過去一年多以來科技圈一直在大喊“代理化”(agentic),真正能在生產環境落地的,其實比例非常低。如果回看過去幾十年的技術擴散,你會發現一個“三步走”的模式:第一步:吸收(Absorb)將新技術作為功能外掛,塞進現有流程,先把能自動化的事情自動化。第二步:創新(Innovate)誕生新產品、新服務、新的捆綁(bundling)和解綁(unbundling)模式。第三步:顛覆(Disrupt)重新定義問題,重塑市場結構。圖7. 每一次平台轉換都遵循同一個節奏來源:《AI eats the world》到目前為止,大部分AI應用還在第一階段——自動化那些顯而易見的工作,比如客服自動回覆、行銷文案生成、軟體開發輔助……這都很正常,所有技術部署都需要時間。比如雲端運算,它在科技行業大概已經算很老的概念了,但實際上它在企業工作流的滲透率只有1/3左右。但是,雖然部署很慢,一旦部署完成,整個企業的運轉方式將會徹底改變。條形碼就是一個經典例子。它在1974年問世,而真正普及是在幾十年之後,可是一旦普及但能管理5倍甚至10倍數量的商品,改寫了整個超市零售的營運方式。AI也會如此。圖8. “條形碼”的部署處理程序來源:《AI eats the world》AI 帶來的真正改變,會發生在那裡?在經歷了無數場AI匯報會、內部試點、demo演示之後,大家難免都會問:AI帶來的真正改變,會發生在那裡?除了自動化,AI還可能是什麼?這個問題,在今天,就像1997年撥號龜速上網的人在問,網際網路到底能幹嘛?——當時沒人能夠想像會有外賣、直播、電商、短影片、移動支付……我們現在也站在這樣一個“模糊卻又隱約可見”的入口。那麼,我們至少可以追問兩個更基礎的問題。■  問題一,AI會拆解什麼?網際網路的故事,其實就是“拆解”的故事:很多書店被拆掉了、電台被拆掉了、報紙被拆掉了……不需要物理形態,也能創造價值。那麼——LLM會拆解什麼?那些過去依賴“人”的部分,會從結構上被抽離出來?■  問題二,AI會重組什麼?網際網路創造了很多新的聚合模式,比如Amazon聚合零售,DoorDash聚合餐飲(類似於中國的美團/餓了麼),Instagram聚合社交,那麼AI能不能提供不同維度的“聚合”?它們的底層邏輯,是演算法替代了人工編輯。而LLMs不僅僅是看你會喜歡什麼,它還能理解你的意圖、你問問題的方式,甚至你沒有說出來的偏好。假如推薦系統能更深層的“懂你”,平台和演算法邏輯會如何改變?以廣告為例,廣告行業是個兆美元規模的市場,目前科技巨頭吃掉了其中一半的收入。現在大家都在用AI最佳化現有業務:行銷團隊原來一個項目做5張物料,現在變成了做200張,甚至300張。這讓我想起了一個古早的笑話:一部分人用AI把三個要點擴寫成一封郵件,另一部分人用AI把一封郵件總結為三個要點。假如現在AI能把三個要點,變成300個廣告。那麼問題來了:誰來理解這些廣告?誰來分發它們?誰來決定該向誰展示?這將通向“代理式消費”(agentic commerce):我不再從亞馬遜中搜尋、不再刷Instagram、而是直接問GPT,我該買那個?泉果視點註:“代理式消費”(agentic commerce)由AI代理幫你完成選品、比較、決策甚至下單的一種消費模式——從“我在平台上自己找東西”,變成“我把任務丟給一個AI助手,讓它幫我搞定”。就像我拍了冰箱存貨的照片給AI,問它我今晚應該做什麼菜,還需要買什麼食材。這不是更快的“購物流程”,而是一種新的“生活路徑”。圖9. 讓AI根據冰箱存貨規劃菜單來源:《AI eats the world》當然,這一切目前還非常早期。這張圖我很喜歡,這是一家東京的書店,它只有16平米,每周只買一本書。你不需要選擇,因為你只有一個選項。圖10. 一室一冊的森岡書店但是在網際網路世界裡,你面前是無限的貨架,為了避免迷失,我們只能依賴不完美的推薦系統。而未來,很可能會變成,每個人都能擁有一間只賣給你一本書的書店——它知道你是誰、你要什麼,也能把最適合你的那一件東西拎出來。未來的系統不再只問“你想買什麼”,而是會反向去理解:“你為什麼想買它?”——你是想獲取功能,還是想獲取體驗?是追求效率,還是審美、品味和身份?AI對人的動機建模,成為推薦系統的新核心。換句話說,我們的AI策略應該是什麼?這個問題沒有統一答案,而是一組關於動機的問題集合,它取決於:誰在問?他處於什麼行業?他為什麼在問這個問題?就像一面鏡子,不同的人會照出不同方向,這才是真正決定答案的因素。結 語停下來,看看AI“嶄新”的外表下,那些似曾相識?我的最後一個觀察是,雖然AI似乎吸引了全部的目光,但那些在AI之前讓我們興奮的技術,其實從未離場。電商已經佔到零售的30%,並且還在繼續增長,尤其在美國之外發展更加迅速。Robotaxi正在各個城市跑起來;Meta的眼鏡、各種形態的機器人,都在悄悄變得更成熟,它們都值得期待。但我們其實應該停下來,想想在“嶄新”的外表下,有些事情是不是似曾相識?這是1951年IBM的廣告:我們的“電子計算器”能讓一個人擁有150名工程師的能力——今天多少AI廣告,其實也在說同樣的話。圖11. 1951年IBM電子計算器廣告1955年,美國政府發佈了一份關於“自動化”的報告,那時候他們把所有新技術都叫自動化。其中提到,有一種可能會被自動化的工作,是電梯操作員。這張照片是我家公寓裡的老式電梯,以前坐電梯需要一個專業電梯員操控。當時還有一個詞叫“電子禮節”(electronic politeness),用紅外線確保電梯不會夾到人。圖12. 老式的手動電梯但是,請問你上一次按電梯時,有沒有意識到自己在用一個“擁有電子禮節的自動化電梯”?你不會。它現在只是一個再普通不過的“電梯”。我們建了大量電梯,然後把它們自動化,再之後——我們完全忘了它們曾經不是自動化的。就像開篇Larry Tesler說過的觀點:“AI是那些機器還做不到的東西——一旦它能做到,我們就會說,那只是軟體。”我們的世界就是這樣不斷改變的。每隔10年,我們“自動化”了一些東西;再過10年,我們忘了它曾經需要人力;又過10年,它們變成了世界隱形的背景。而就在這個過程中,世界被一次次地重新書寫。 (泉果視點)
Corewave背後的邏輯
大家都稱Corewave為輝達的親兒子,這點確實不假。從Corewave的發展史就可以看出,創始人均來自避險基金公司,17年從礦卡公司轉型。從23年4月,就拿到Magnetar Capital公司的融資,同時拿到輝達的融資。接著23年5月,Magnetar又追加投資。到了23年8月,Chatgpt發展的非常好,這時他們也服務了Chatgpt,黑石和Magnetar和他們一起進行了債務融資23億美元。後來24年5月的時候黑石又一次領投債務投資,融資75億美元。這些融資的抵押就是公司持有的輝達的H100和H200.輝達自B輪就開始入股,持股約6%,而且與Corewave共建Plato的超級算力中心。因為能夠拿到更多的輝達的卡,拿到了微軟+Open AI的客戶,目前OpenAI和微軟加起來佔其業務總額的62-72%之間。作為AI Infra公司,目前公司提供GPU雲服務,推理服務等業務。按其所說,能夠提供差異化的,更高效率,更好的訓練效果的雲服務。比起傳統架構性能提升30-50%,低延遲的網路,以及更優的儲存速度。但懂行的都清楚,Corewave能夠拉攏到大客戶最重要的原因就是因為他們有輝達的卡,其他都沒有這麼關鍵。因此,財務收入節節高昇。未來,因為AI的推理和訓練市場仍然有Carg 90%的增速,因此仍然非常看好未來的增長空間。但同時,尤其公司有大量的負債,差不多100億美元負債,因此利息支出非常的高。相比別的而言,高很多。因此,未來的估值情況,我們可以初步判斷為:這樣的話,公司的增長空間還是不錯的。 (老王說事)
美國四大AI巨頭:美國必須放鬆對中國的制裁,只有讓中國市場上充斥著美國晶片,才能壓制住中國自主晶片的技術發展
01 前沿導讀美國ai巨頭open ai、微軟、AMD、CoreWeave等企業在聽證會中一致表示,儘管美國在ai領域目前處於領先地位,但是美國政府依然需要提高警惕性,提高對基礎技術的投資。#openAI、#微軟、#AMD並且還要在一定程度上放鬆對中國的制裁措施,只有讓美國的ai晶片充斥中國市場,才能壓制中國自主晶片的發展,保持美國對中國的領先。02 對華限制的影響據華制國際的報告顯示,中國是目前國際上最大的單一消費市場,其佔據了全球晶片採購量的42%左右。在美國對中國的ai產業實行出口限制之後,美國的相關企業出現了500億美元以上的直接損失。自從2023年以來,輝達針對中國市場推出了特供版的H20晶片,但是該產品依然受到了美國政府的重重出口限制。據輝達官方表示,美國對H20晶片的限制,使輝達公司承受了55億美元的損失。#輝達儘管美國政府一再阻撓中國企業獲得輝達晶片,但是輝達依然想盡辦法推出合法合規的晶片,企圖與中國市場重新建立合作。微軟總裁布萊德·史密斯,在聽證會中重點強調:美國目前在這場技術競爭當中處於領先位置,但是這場技術競賽還會持續焦灼下去。其中的決定性因素,就是誰的技術能在全球範圍內被廣泛應用。只有能在全球範圍內獲得支援的國家企業,才是ai競爭當中的最後贏家。世界上有18%的人口生活在中國,4%的人口在美國,78%的人口在其他國家。從中國的華為公司主導5G技術的例子中可以看到,誰先進一步佔領市場,誰就會被很難取代。我們必須要在合理的管控下推進技術的出口,建立全球範圍內的信任機制。而在建立全球化的技術過程中,中國企業表現最突出,也最優秀。AMD公司的CEO蘇姿丰在聽證會中指出:AI技術需要全球市場的迭代驗證,中國擁有全球最多的AI應用場景和演算法工程師群體,脫離這個生態將導致技術路線偏航。這些美國科技巨頭的發言,其重點話題就是ai技術在國際市場上面的接受程度。誰先搶到國際市場的認可,誰就可以成為技術的領導者。03 市場競爭雖然美國的GPT系統,曾經被譽為是國際民用ai大模型的領先者。但是在中國的deepseek出現之後,GPT的優勢蕩然無存。而且deepseek選擇將自家的大模型技術全部進行開源,允許國際上面的企業開發者免費使用。#DeepSeekGPT通過閉源的方式,建立起一個屬於美國ai技術的護城河。但是中國的deepseek選擇用開放原始碼的方式,將中國的大模型技術傳播到世界各地,獲得了非常不錯的市場反響,推動了中國ai技術在國際市場上的全面爆發。根據彭博社相關機構的資料測算顯示,如果美國選擇釋放對華的限制措施,允許美國企業將先進晶片出口到中國,那麼這將會讓輝達的在華業務出現大幅度的增長,其應收回升到120億美元。中國企業已經在存算一體晶片領域實現了技術突破,並且其晶片的整體水平已經逼近輝達H100大約80%左右的算力性能。單純的對中國企業進行出口限制,已經沒有任何意義。況且中國企業正在擴充成熟晶片的產能,當中國的成熟晶片達到了一定的規模之後,銷售這些晶片所獲得的利潤,將會被反哺到先進晶片的發展當中,從而實現正向循環的產業模式。中國企業正在逐步過渡到自主技術的產業鏈模式,如果在這個期間,美國政府放鬆管制條例,將高水平的美國晶片出口到中國市場,這對於那些還未完成國產供應鏈模式的中國企業來說,是一個壓制性的政策,這也是美國晶片企業所希望看到的局面。目前的中國晶片產業,在邏輯晶片領域被卡在了7nm節點。這些國產晶片採用的都是DUV裝置加上自對準多重圖案化技術所製造的產品,其製造成本、產品性能、綜合能耗均還有較大的發展空間。一旦中國企業用某種方式實現了更加優秀的晶片製造工藝,那麼這將會直接衝擊海外企業在國內市場的發展前景,從而讓中國自主的產品替換掉海外進口產品。這對於美國晶片企業來說,是一個非常不好的消息。中國市場的發展前景廣闊,消費水平較強,是國際產業競爭的焦點。一旦讓中國自主的技術產品充斥整個國內市場,那麼留給美國企業的時間就不多了。 (逍遙漠)
超越DeepSeek,中國開源“集團軍”正重塑全球AI生態
導語:中國開源,正在形成集團化作戰的優勢。DeepSeek和阿里Qwen等基礎模型撐起了中國開放原始碼的上限,而更多的中小企業正在它們的基礎上,不斷推出體量更小卻能力更強的垂直模型,讓今年以來中國大模型更新的速度不斷加快,不斷帶來新的驚喜。而在美國仍以閉源為主的背景下,中國企業擁抱開放原始碼的做法充分展現了中國的技術自信,也開闢出一條技術普惠與全球共生的新路徑,持續開拓海外市場,代表著全球AI技術從“單極霸權”轉向“多極共生”。01. 中國開源,正形成合力2月初,當中國開源大模型DeepSeek在全球140個國家和地區的應用市場下載排行榜同時登頂,OpenAI卻公然在媒體上指責,DeepSeek未經許可使用了ChatGPT的蒸餾資料。這樣的指責非但沒能為OpenAI“挽尊”,卻招來全球科研從業者的“群嘲”。如今,又一個把蒸餾buff疊滿的選手出現了。4月13日,崑崙萬維推出Skywork-OR1(Open Reasoner 1)系列模型,同規模下性能超越阿里QwQ-32B,對齊DeepSeek-R1。資金實力並不雄厚的崑崙萬維,為什麼也可以做出SOTA等級的大模型?其實官方並不諱言,他們的模型是基於DeepSeek-R1-Distill-Qwen-7B和DeepSeek-R1-Distill-Qwen-32B這兩款模型訓練而來。而正如名字裡體現的那樣,DeepSeek的這兩款模型,又蒸餾了阿里的Qwen系列模型。在借力優秀開源模型的同時,崑崙萬維也在為開源社區做出自己的貢獻。相比於只開源模型權重的DeepSeek,崑崙萬維還開放了自己使用的資料集和訓練程式碼,更加接近於“真開源”的概念。這意味著,任何使用者都可以去嘗試復刻他們的模型訓練過程。崑崙萬維這份成果,充分展示了開源最重要的意義——不僅僅是讓給使用者提供一個免費可用的產品,更能夠讓更多開發者站在前人的肩膀上,快速、低成本地推動技術繼續前進。事實上,就在去年業界還在討論大模型預訓練遭遇瓶頸的背景下,今年以來,中國大模型的迭代速度卻仍在加快,並且越來越多的企業投入開源。阿里雲通義千問從除夕夜開源全新的視覺模型Qwen2.5-VL,再到3月初發佈並開源了全新推理模型QwQ-32B,在開源當日就登頂全球主流AI開源社區HuggingFace的趨勢榜。階躍星辰則在一個月左右時間開源三款多模態大模型,其最新開放原始碼的是圖生視訊模型Step-Video-TI2V,支援生成的視訊具備運動幅度可控和鏡頭運動可控兩大核心特點,同時自帶一定的特效生成能力。智譜則在4月宣佈開源32B/9B 系列GLM模型,涵蓋基座、推理、沉思模型,均遵循MIT許可協議。甚至一度閉源的百度,也宣佈將於6月30日完全開源文心大模型。相比於國內開源生態的日益繁榮,美國大模型公司至今仍以閉源為主,這也讓中國大模型的出海迎來難得機遇——DeepSeek讓印尼教育公司Ruangguru借此低成本最佳化了教學模型;新加坡 B2B旅遊技術公司Atlas將Qwen整合至智能客服系統,實現7×24小時多語言支援……02. 為何美國閉源,中國開源?美國AI傾向閉源而中國AI愈發開放,實際上是兩國AI發展環境的必然結果。美國的AI產業主要由科技大廠和VC(風險投資人)主導,由於資方對於AI有著巨大的資本回報預期。因此美國的AI模型企業普遍具有強烈的技術信仰,即追求技術領先後實現一定程度的市場壟斷後創造巨額利潤,其生態也天然的傾向於閉源。以OpenAI發展歷程為例,其在創立期間作為非盈利實體,此後卻不斷走向封閉——GPT-1時完全開源,GPT-2部分開源遭遇反對後才全面開源,GPT-3正式走向閉源,隨後GPT-4時閉源策略進一步強化,模型架構、訓練資料完全保密,甚至限制企業使用者的API呼叫頻率。儘管OpenAI表示閉源是基於合規和管控技術濫用的出發點,但市場普遍認為OpenAI轉向閉源的標誌性事件是其與微軟達成百億美元級合作,將GPT-3嵌入Azure雲服務,形成“技術-資本”閉環。在去年10月微軟首次在財報披露其對OpenAI投資時就表示:“我們對OpenAIGlobal,LLC進行了投資,總投資承諾為130億美元,投資按權益法核算。”所謂的權益法也可以理解為微軟對於OpenAI的投資的目的是獲得回報而不是單純的慈善科研,顯然OpenAI通過閉源生態賣高價API就是其目前最大的收入來源,也成了OpenAI不願開放原始碼的最大阻力。而從OpenAI“分家”成立的Anthropic,更是在一開始就堅定了閉源路線,其大模型產品Claude則全面採取了閉源模式。而即便是美國開源唯一扛把子的META旗下的Llama,開源時也加入了兩條防友商條款:1、開源模型在META批准前不能用於超過7億月活的產品和服務2、不能利用Llama模型的輸出內容來訓練和改進其他的大語言模型可以看到,即便是開源模型,Meta的核心目的依然是打造自己的AI生態而非技術普惠。美國在資本層面選擇了閉源為主,開源為輔的AI戰略,可以說是純商業考量。相比之下,中國自上而下的頂層設計從一開始就重視開源,體現了自主可控思維下的產業優先路徑。早在2017年,中國政府就發佈了《新一代人工智慧發展規劃》,明確提出要加快AI與經濟、社會深度融合的目標,部署構築AI發展的先發優勢。2021年,開源相關內容更是明確列入中國“十四五”規劃中,引發各地積極推動技術革新處理程序。中國科學院院士梅宏就曾表示,語言模型未來的發展必須依賴於開源平台,只有在一個開放的環境中,才能確保各行業使用者對資料上傳和業務整合的安全性與信任度。去年12月工信部等四部門發佈的《中小企業數位化賦能專項行動方案(2025—2027年)》中,明確支援開放原子開源基金會設立“中小企業AI開源專項”,提供可複製,易推廣的訓練框架、測試工具等資源,降低企業技術門檻。工信部等四部門發佈的《中小企業數位化賦能專項行動方案(2025—2027年)》一個更現實的問題是,由於美國的潛在技術封鎖,中國在AI領域並不能單純的做追隨者,而必須打造能夠獨立自主的國產生態,在美國已經建設了一套閉源為主的生態下,再建設一套閉源生態無異於閉門造車,唯有開源生態才能快速助力AI產業的發展。除了頂層支援外,各地對開源生態上也付出了真金白銀的支援。智譜聯合北京國資成立的專注於大模型生態投資的Z基金宣佈,出資3億元支援全球範圍內的AI開源社區發展,任何基於開源模型(不侷限於智譜開源模型)的創業項目均可申請。中美AI產業在開源與閉源策略上的分野,本質是發展邏輯的根本差異——美國受資本驅動,科技大廠與VC的盈利訴求催生了“技術壟斷-高價變現”的閉源生態,即便如Meta嘗試開源,也難逃商業壁壘的桎梏;中國則依託頂層設計,以“技術平權+產業協同”為核心理念,通過政策賦能建構開放生態,讓開源成為降低技術門檻、推動實體經濟融合的基礎設施。這種戰略選擇,既塑造了兩國AI產業的不同路徑,也預示著全球AI生態正從“壟斷競爭”向“開放共贏”加速演進。03. 夠用就是夠好中國的AI開源生態,不僅正在加速中國及全世界的AI產業化發展,還讓美國技術優先的信仰陷入了一個尷尬的陷阱。面對DeepSeek效應帶來的步步緊逼,4月5日,Meta發佈自稱有史以來最強多模態大模型Llama4。然而實測下來,這是一款讓人大跌眼鏡的模型,號稱10m tokens的上下文長度頻頻出錯、初代小球測試難以完成、9.11>9.9的比大小失誤……模型上線幾天內,高管離職、測試作弊等醜聞也被內部員工爆料證實。更多消息證明,Llama4可謂是祖克柏趕鴨子上架的產物。那麼問題來了,為什麼祖克柏一定要趕在4月上線呢?正如前文所述,美國AI產業界對於技術有一種迷之信仰,認為自己的產品必須最強、最先進,因此紛紛開啟軍備競賽。而訓練AI所需的邊際效應遞減,使得大廠們在消耗了天量成本後,技術門檻不僅沒有建成,反而陷入了算力瓶頸的泥沼。OpenAI剛發佈GPT-4o的圖像生成功能,幾天後Altman就發推說他們的GPU“快燒了”。Gemini2.5發佈不到一周,GoogleAIStudio負責人就說他們仍受“速率限制”困擾,開發者每分鐘只能發20個請求。似乎沒有一家公司能應對超大模型的推理需求。GPT-4o生成的吉卜力風格的AI圖片實際上,美國正在陷入誤區。智源研究院的負責人表示:“如果一個新模型用100倍成本跑出了10分基準測試分的提升,那麼這個新模型對於80%以上的應用場景就毫無意義,因為沒有任何性價比。”而中國大模型企業加速開源生態,看似不再去爭奪這個第一,反而憑藉著“夠用就好”贏得了更多的客戶,尤其是工業界客戶的認可。相比於政企客戶動不動千萬的預算,很多企業和機構既有迫切的AI需求,但是又沒有那麼多預算現成解決方案,利用開源模型自行開發幾乎成為了他們不二之選:寶鋼用冶金工程關鍵工序“大模型+小模型”進行生產裝置智能預警;中煤科工的“煤科衛士大模型ChinamjGPT”,使煤機裝備裝置故障停機時間、維修成本分別降低30%和20%;上海孟伯智能物聯網科技有限公司基於輕量大模型打造了邊剪檢測、連退爐工藝最佳化應用平台;彌費科技基於大模型技術實現了半導體晶圓廠自動物料搬運系統智能預測維護與管理。這些都是開源模型在工業場景落地的代表案例。而除了工業用途外,開源生態也能幫助更多的公益事業。山水自然保護中心致力於雪豹及高原生態系統的保護,布設的紅外相機每個季度會拍攝大量照片或視訊,靠人工識別雪豹蹤跡效率極低,耗費大量時間和人力。華為昇騰與山水自然保護中心合作進行雪豹蹤跡識別華為把三江源紅外影像物種識別的相關模型和工具開源,降低了參與AI開發的門檻,讓更多使用該模型的研究保護機構受益,可舉眾人之力在資料集、資料處理和資料清洗多方面最佳化模型。04. 開放原始碼的 “集市”效應開放原始碼軟體運動的旗手、美國人埃裡克·雷蒙德在1999年的《大教堂與集市》一書中提出一個比喻:傳統的、封閉的軟體開發模式如同建造一座大教堂,軟體由少數專家(建築師)在與世隔絕的環境中精心設計和建構,只有在最終完成後才發佈給使用者;而開放原始碼的開發模式。如同一個熙熙攘攘、看似混亂但充滿活力的集市,軟體開發是公開的、去中心化的、演進式的。書中認為,對於許多類型的軟體項目,尤其是複雜的系統級軟體(如作業系統核心),開放、協作、去中心化的“集市”開發模式,儘管看起來可能混亂,但實際上比傳統、封閉、集中式的“大教堂”模式更有效率、更能產生高品質、更健壯的軟體。 它通過“早發佈、常發佈”和利用大規模同行評審(“足夠多的眼睛”)等機制,能夠更快地發現和修復錯誤,並更好地吸納使用者反饋和社區貢獻,從而推動軟體的快速迭代和創新。Linux等開放原始碼專案的巨大成功,驗證了雷蒙德的觀點。開源運動曾經為美國和世界帶來遠超投入本身的巨大價值。哈佛大學2024年的一份研究報告表示:“開源投入41.5億美元,為企業創造了8.8兆美元價值(即每投入1美元,創造2000美元價值)。如果沒有開源,企業在軟體上的支出將是現在的3.5倍。”如今,中國公司學到了這一點。美國AI企業似乎卻忘了。事實上,對於中國的大模型企業們,即使不考慮社會效益,選擇擁抱開源生態對於企業本身也並非無利可圖。多家大模型企業均告訴觀察者網,開源並不是放棄商業化,開源依然有開放原始碼的盈利邏輯,比起開不開源,如何技術上更加服務好客戶才是關鍵的問題。以智譜AI為例,其宣稱為國內唯一全面對標OpenAI的企業,但相比於OpenAI的閉源戰略,其反而是行業內開源戰略最堅定的踐行者之一。智譜於2023年率先開源國內第一個Chat大模型ChatGLM-6B,成立近六年來,智譜已開源55餘款模型,在國際開源社區累計下載量近4000萬次。智譜告訴觀察者網,智譜希望自己的開源戰略為北京打造人工智慧“全球開源之都”貢獻自己的力量。而具體到商業層面,智譜則選擇了開源吸引開發者生態,向B端和G端提供付費的定製解決方案。而除了賣解決方案,賣API也是一個重要的盈利環節。以DeepSeek為例,開源模型的第一筆生意是高性能API的銷售。基礎服務雖免費,但企業可提供高性能API服務,按呼叫量收費。DeepSeek-R1的API定價為每百萬輸入Token1元,每百萬輸出tokens16元。免費token額度用完了或者基礎API滿足不了需求,使用者就傾向於使用付費版保持業務流程的穩定性。相比於只有模型服務的企業,阿里則選擇另一種開源變現模式——生態捆綁。阿里的Qwen系列作為開源急先鋒,通過全模態開源吸引開發者使用雲端運算等基礎設施,形成場景閉環。他們的模型在前期只是一個引子,明碼標價的商品實則是雲服務。中國開源大模型的全球化應用已從“技術跟隨”轉向“生態主導”。當美國陷入“閉源壟斷”與“開源失控”的兩難時,中國通過“協議創新+場景深耕”,正在重構全球AI開源生態的底層邏輯。這場博弈的終極戰場,不在參數規模的競賽,而在AI技術與實體經濟深度融合的兆級市場。 (科工力量)